home *** CD-ROM | disk | FTP | other *** search
/ CU Amiga Super CD-ROM 19 / CU Amiga Magazine's Super CD-ROM 19 (1998)(EMAP Images)(GB)[!][issue 1998-02].iso / CUCD / Online / RFCs / rfc / rfc0683.txt < prev    next >
Text File  |  1994-01-21  |  9KB  |  176 lines

  1.  
  2.                               RFC 683, NIC 32251
  3.  
  4.                 FTPSRV - TENEX FTP EXTENSIONS FOR PAGED FILES
  5.  
  6.                         R. Clements - BBN - 3 April 75
  7.  
  8.  
  9.  
  10.  
  11.  
  12. 1   Introduction
  13.  
  14.     In response to a long-known need for the ability to transfer TENEX paged
  15. files over the net via FTP, the TENEX FTP implementation has been extended.
  16.  
  17.     This implementation is an extension to the "OLD" protocol (RFC 354).  It
  18. was built after useful discussions with Postel, Neigus, et al.  I do not mean
  19. to imply that they agreed that this implementation is correct, nor for that
  20. matter do I feel it is correct.  A "correct" implementation will be negotiated
  21. and implemented in the "NEW" protocol (RFC 542), if funding ever appears for
  22. that task.
  23.  
  24. 2   The Problem(s)
  25.  
  26.     This extension attacks two separate problems: Network reliability and
  27. TENEX disk file format's incompatibility with FTP.  A checksummed and
  28. block-sequence-numbered transmission mode is seriously needed, in my opinion.
  29. This mode should also allow data compression.
  30.  
  31.     It is also necessary to handle paged, holey TENEX files.  This latter
  32. problem, seriously needed for NLS, is the motivation for the current
  33. extension.
  34.  
  35.     The former problem requires a new MODE command, if done correctly;
  36. probably two MODEs, to allow data compression in addition to checksumming.
  37. Actually, I think that is the tip of an iceberg which grows as 2**N for
  38. additional sorts of modes, so maybe some mode combination system needs to be
  39. dreamed up.  Cf the AN, AT, AC, EN, ET, EC TYPEs.  Also, one should be able to
  40. use MODE B and MODE C together (NEW protocol) to gain both the compression and
  41. restart facilities if one wanted.
  42.  
  43.     The second problem, TENEX files, are probably a new kind of STRUcture.
  44. However, it should be possible to send a paper tape to a disk file, or vice
  45. versa, with the transfer looking like a paged file; so perhaps we are dealing
  46. with a data representation TYPE.  This argument is a bit strained, though, so
  47. a paged STRUcture is quite likely correct.  I admit to feeling very unsure
  48. about what is a MODE, what is a TYPE and what is a STRUcture.
  49.  
  50. 3   The (Incorrect) choices made
  51.  
  52.     Having decided that new MODEs and STRUctures were needed, I instead
  53. implemented the whole thing as a single new TYPE.  After all, I rationalize,
  54. checksumming the data on the network (MODE) and representing the data in the
  55. processing system as a checksummed TYPE are really just a matter of where you
  56. draw the imaginary line between the net and the data.  Also, a single new TYPE
  57. command reduced the size of the surgery required on the FTP user and server
  58. programs.
  59.  
  60. 4   Implementation details
  61.  
  62.     The name of the new TYPE is "XTP".  I propose this as a standard for all
  63. the Key Letter class of FTP commands: the "X" stands for "experimental" --
  64. agreed on between cooperating sites.  The letter after the "X" is signed out
  65. from the protocol deity by an implementor for a given system.  In this case,
  66. "T" is for TENEX.  Subsequent letter(s) distinguish among possibly multiple
  67. private values of the FTP command.  Here "P" is "Paged" type.
  68.  
  69.    TYPE XTP is only implemented for STRU F, BYTE 36, and MODE S.
  70.  
  71.     Information of TYPE XTP is transfered in chunks (I intentionally avoid the
  72. words RECORD and BLOCK) which consist of a header and some data.  The data in
  73. a chunk may be part of the data portion of the file being transferred, or it
  74. may be the FDB (File Descriptor Block) associated with the file.  
  75.  
  76. 5   Diversion: the TENEX Disk File
  77.  
  78.     For those not familiar with the TENEX file system, a brief dissertation is
  79. included here to make the rest of the implementation meaningful.
  80.  
  81.     A TENEX disk file consists of four things: a pathname, a page table, a
  82. (possibly empty) set of pages, and a set of attributes.
  83.  
  84.     The pathname is specified in the RETR or STOR verb.  It includes the
  85. directory name, file name, file name extension, and version number.
  86.  
  87.     The page table contains up to 2**18 entries.  Each entry may be EMPTY, or
  88. may point to a page.  If it is not empty, there are also some page-specific
  89. access bits; not all pages of a file need have the same access protection.
  90.  
  91.     A page is a contiguous set of 512 words of 36 bits each.
  92.  
  93.     The attributes of the file, in the FDB, contain such things as creation
  94. time, write time, read time, writer's byte-size, end of file pointer, count of
  95. reads and writes, backup system tape numbers, etc.
  96.  
  97.     NOTE: there is NO requirement that pages in the page table be contiguous.
  98. There may be empty page table slots between occupied ones.  Also, the end of
  99. file pointer is simply a number.  There is no requirement that it in fact
  100. point at the "last" datum in the file. Ordinary sequential I/O calls in TENEX
  101. will cause the end of file pointer to be left after the last datum written,
  102. but other operations may cause it not to be so, if a particular programming
  103. system so requires.
  104.  
  105.     In fact both of these special cases, "holey" files and end-of-file
  106. pointers not at the end of the file, occur with NLS data files.  These files
  107. were the motivation for the new TYPE.
  108.  
  109. 6   Meanwhile, back at the implementation,...
  110.  
  111.     Each chunk of information has a header.  The first byte, which is the
  112. first word (since TYPE XTP is only implemented for BYTE 36) of the chunk, is a
  113. small number, currently 6, which is the number of following words which are
  114. still in the header.  Next come those six words, and then come some data
  115. words.
  116.  
  117.    The six header words are:
  118.       Word 1: a checksum.
  119.          This is a one's complement sum (magnitude and end-around carry) of 
  120.          the six header words and the following data words (but not the 
  121.          leading "6" itself).  The sum of all words including the checksum 
  122.          must come out + or - zero.
  123.       Word 2: A sequence number.
  124.          The first chunk is number 1, the second is number 2, etc.
  125.       Word 3: NDW,
  126.          the number of data words in this chunk, following the header.  Thus
  127.          the total length of the chunk is 1 (the word containing NHEAD) + 
  128.          NHEAD +NDW.  The checksum checks all but the first of these.
  129.       Word 4: Page number.
  130.          If the data is a disk file page, this is the number of that page in
  131.          the file's page map.  Empty pages (holes) in the file are simply 
  132.          not sent.  Note that a hole is NOT the same as a page of zeroes.
  133.       Word 5: ACCESS.
  134.          The access bits associated with the page in the file's page map.  
  135.          (This full word quantity is put into AC2 of an SPACS by the program
  136.          reading from net to disk.)
  137.       Word 6: TYPE.
  138.          A code for what type of chunk this is. Currently, only type zero 
  139.          for a data page, and type -3 for an FDB are sent.
  140.  
  141.     After the header are NDW data words.  NDW is currently either 1000 octal
  142. for a data page or 25 octal for an FDB.  Trailing zeroes in a disk file page
  143. will soon be discarded, making NDW less than 1000 in that case.  The receiving
  144. portions of FTP server and user will accept these shortened pages.  The sender
  145. doesn't happen to send them that way yet.
  146.  
  147. Verification is performed such that an error is reported if either:
  148.    The checksum fails,
  149.    The sequence number is not correct,
  150.    NDW is unreasonable for the given chunk type, or
  151.    The network file ends at some point other than immediately following the 
  152. data portion of an FDB chunk.
  153.  
  154. 7   Closing comments
  155.  
  156.     This FTP server and user are in operation on all the BBN systems and at
  157. some other sites -- the user being more widely distributed since fewer sites
  158. have made local modifications to the user process.
  159.  
  160.     I believe the issues of checksumming and sequencing should be addressed
  161. for the "NEW" protocol.  I hope the dissertation on TENEX files has been
  162. useful to users of other systems.  It may explain my lack of comprehension of
  163. the "record" concept, for example.  A TENEX file is just a bunch of words
  164. pointed to by a page table.  If those words contain CRLF's, fine -- but that
  165. doesn't mean "record" to TENEX. I think this RFC also points out clearly that
  166. net data transfers are implemented like the layers of an onion: some
  167. characters are packaged into a line.  Some lines are packaged into a file.
  168. The file is broken into other managable units for transmission.  Those units
  169. have compression applied to them.  The units may be flagged by restart markers
  170. (has anyone actually done that?).  The compressed units may be checksummed,
  171. sequence numbered, date-and-time stamped, and flagged special delivery.  On
  172. the other end, the process is reversed.  Perhaps MODE, TYPE, and STRU don't
  173. really adequately describe the situation. This RFC was written to allow
  174. implementors to interface with the new FTP server at TENEX sites which install
  175. it.  It is also really a request for comments on some of these other issues.
  176.